8. 2群の差の分析2
https://gyazo.com/4f7dfd91756d579cff6ea820ee6ff329
8.1. 2変数の基本的推測
実験群と対照群の差異は、平均値の差でだけではなく、いくつかの指標を併用することによって、詳細に考察できる
本章の考察は、特に断らな場合にはEQUによる分析をもとにする
8.1.1. 平均値の差の推測
RQ.1 平均値の差$ \mu_1 - \mu_2の点推定と区間推定
e.g. 実測値に対して目測値は平均的に何mm長い(短い)だろうか。またその差はどの程度の幅で確信できるだろう。少なくとも、あるいは高々その差はどのくらいだろう
RQ.2 第1群の平均値$ \mu_1が第2群の平均値$ \mu_2より高い確率
e.g. 目測値の母平均が実測値の母平均より長い(短い)確率はどれほどだろうか
RQ.3 平均値の差が基準点$ cより」大きい確率
e.g. 目測地の母平均が実測値の母平均より10mm長い確率はどれほどだろうか
table: 表8-1 平均値の差μ₁-μ₂の推測
EAP post.sd 2.5% 5% 50% 95% 97.5%
μ₁ - μ₂(EQU) 29.9 15.5 -0.9 5.0 29.8 54.7 61.0
p(μ₁ - μ₂ > 0) 0.97
p(μ₁ - μ₂ > 10) 0.91
μ₁ - μ₂(DEF) 29.9 17.5 -5.5 1.8 29.8 58.2 65.2
p(μ₁ - μ₂ > 0) 0.96
p(μ₁ - μ₂ > 10) 0.89
推測
実測値に対して目測値は平均的に$ 29.9mm長い
事後標準偏差は$ 15.5 であり、95%確信区間は$ [-0.9, 61.0] である
95%の確信で、少なくとも$ 5.0mmは差があり、高々$ 54.7しか差がない(RQ.1)
https://gyazo.com/4201d393e8c89637e2101782b59a7020
目測値の母平均が実測値の母平均より長い確率$ p(\mu_1 - \mu_2 > 0)は$ 0.97である(RQ.2)
目測値の母平均が実測値の母平均より$ 10mm以上長い確率$ p(\mu_1 - \mu_2 > 10)は$ 0.91である(RQ.3)
8.1.2. 相関の推測
RQ.4 相関の点推定・区間推定
e.g. 実測値と目測値の相関はどれほどだろうか。また相関はどの程度の幅で確信できるだろう。少なくとも、あるいは高々どのくらいだろう。
RQ.5 相関が基準点より大きい(小さい)確率。ある範囲にある確率
e.g. 実測値と目測値の相関が$ 0.5より大きい確率はどれくらいだろう
相関$ \rhoの事後分布は、表7-5で示したように、すでにMCMCによって求められている
表7-5を参照して、点推定値、post.sd、%点、確信区間、片側上限、片側下限の点を評価する
https://gyazo.com/cd64c7a51ca8d9a803b2d45bf8cedd51
実測値と目測値の相関は$ 0.60である(EAP推定)
事後標準偏差は$ 0.21 であり、95%確信区間は$ [0.06, 0.89] であり、95%の確信で少なくとも$ 0.18であり、高々$ 0.87しかない(RQ.4)
相関が区間$ (c, c')にある確率を求めることができる
「研究仮説$ U_{c<\rho<c'}: $ \rhoは区間$ (c, c')にある」が正しい確率$ p(c < \rho < c')は以下の生成量のEAPで評価する(RQ.5)
$ u_{c<\rho<c'}^{(t)} = \begin{cases} 1 & c < \rho^{(t)} < c' \\ 0 & それ以外の場合 \end{cases} \qquad (8.1)
基準値を$ c = 0.5, c' = 1.0としたとき、実測値と目測値の相関が$ 0.5以上である確率$ p(0.5 \leq \rho)は$ 0.73である(RQ.5)
8.1.3. 差得点の標準偏差の推測
RQ.6 差得点の標準偏差の点推定・区間推定
e.g. 目測値と実測値の差は、長さの評価のズレ(誤差)である。この差はどのような分布に従うのだろう。平均的な散らばりはどれほどだろうか。また、その散らばりはどの程度の幅で確信できるだろう。少なくとも、あるいは高々どのくらいだろう。
RQ.7 差得点の標準偏差が基準点$ cより小さい確率
e.g. 目測地と実測値の差の標準偏差が$ 30より小さく確率はどれほどだろう
2つの標準偏差が等しい($ \sigma = \sigma_1 = \sigma_2, EQU)と仮定するとき、得知恵の観測対象$ iの2つの変数の差得点は以下の正規分布に従う
$ x_{1i}^* - x_{2i}^* \sim N\left(\mu_1 - \mu_2, \sigma\sqrt{2(1-\rho)}\right) \qquad (8.2)
2つの標準偏差が異なる($ \sigma_1 \neq \sigma_2, DEF)のとき、特定の観測対象$ iの2つの変数の差得点は以下の正規分布に従う
$ x_{1i}^* - x_{2i}^* \sim N\left(\mu_1 - \mu_2, \sqrt{\sigma_1^2 + \sigma_2^2 - 2\rho\sigma_1\sigma_2}\right) \qquad (8.3)
差得点の標準偏差$ \sigma' = \sigma\sqrt{2(1-\rho)}の事後分布は以下の生成量によって近似できる
$ \sigma'^{(t)} = \sigma^{(t)}\sqrt{2(1-\rho^{(t)})} \qquad (8.4)
近似された事後分布を要約して点推定値、post.sd、%点、確信区間、片側上限、片側下限の点を評価する
差得点の標準偏差$ \sigma' = \sqrt{\sigma_1^{2(t)}+ \sigma_2^{2(t)} - 2\rho\sigma_1\sigma_2}の事後分布は、以下の生成量によって近似できる
$ \sigma'^{(t)} = \sqrt{\sigma_1^{2(t)} + \sigma_2^{2(t)} - 2\rho^{(t)}\sigma_1^{(t)}\sigma_2^{(t)}} \qquad (8.5)
基準点$ cを定め、「研究仮説$ U_{\sigma' < c}: 差得点の標準偏差$ \sigma'は$ cより小さい」が正しい確率は、以下の生成量のEAPで評価する
$ u_{\sigma' < c}^{(t)} = \begin{cases} 1 & \sigma'^{(t)} < c \\ 0 & それ以外の場合 \end{cases} \qquad (8.6)
表8-2を参照して、点推定値、post.sd、確信区間、片側上限、片側下限の点を評価する
table: 表8-2 差得点の標準偏差の推測
EAP post.sd 2.5% 5% 50% 95% 97.5%
σ' (EQU) 47.0 13.6 28.7 30.5 44.4 72.1 80.7
p(σ' < 30) 0.04
σ' (DEF) 53.0 16.2 31.1 33.2 49.9 83.9 93.8
p(σ' < 30) 0.02
図8-2に差得点の標準偏差の事後分布を示す
https://gyazo.com/8d984baa250ef7cd791ac34492ce3906
差得点の標準偏差は$ 47.0である(EAP推定)
事後標準偏差は$ 13.6 であり、95%確信区間は$ [28.7, 80.7] である
95%の確信で、少なくとも$ 30.5であり、高々$ 72.1しかない(RQ.6)
基準値を$ c = 30としたとき、差得点の標準偏差が$ 30より小さい確率$ p(\sigma' < 30)は$ 0.04である(RQ.7)
8.2 差得点の効果量
RQ.8 差得点の効果量$ \delta'の点推定・区間推定
e.g. 目測値と実測値の平均値の差に対する差得点の標準偏差の比はどれ程であろうか。またその比を差得点の効果量と呼ぶとき、どの区間にあるだろう。少なくとも、あるいは高々どのくらいだろう。
RQ.9 差得点の効果量$ \delta'が基準点$ cより大きい確率
e.g. 差得点の効果量が$ 0.3より大きい確率はどれほどだろう
対応がある場合の差得点の効果量は、EQUでは平均値の差を差得点の標準偏差で割って定義する
$ \delta' = \frac{\mu_1 - \mu_2}{\sigma'} = \frac{\mu_1-\mu_2}{\sigma\sqrt{2(1-\rho)}} \qquad (8.7)
平均値差は、差得点の平均的散らばりの何杯かという指標
また、DEFでは以下になる
$ \delta' = \frac{\mu_1 - \mu_2}{\sigma'} = \frac{\mu_1 - \mu_2}{\sqrt{\sigma_1^2 + \sigma_2^2 - 2\rho\sigma_1\sigma_2}} \qquad (8.8)
8.2.1. 事後分布
差得点の効果量の事後分布は、EQUとDEFでそれぞれ以下の生成量によって近似できる
$ \delta'^{(t)} = \frac{\mu_1^{(t)}-\mu_2^{(t)}}{\sigma^{(t)}\sqrt{2(1-\rho^{(t)})}} \qquad (8.9)
$ \delta'^{(t)} = \frac{\mu_1^{(t)} - \mu_2^{(t)}}{\sqrt{\sigma_1^{(t)2} + \sigma_2^{(t)2} - 2\rho^{(t)}\sigma_1^{(t)}\sigma_2^{(t)}}} \qquad (8.10)
図8-3に差得点の効果量の事後分布を示す
https://gyazo.com/312669f05bd709d0f77f5c81623f1040
近似された事後分布を要約して、点推定値、post.sd、%点、確信区間、片側上限、片側下限の点を評価する(RQ.8)
table: 表8-3 差得点の効果量の推測
EAP post.sd 2.5% 5% 50% 95% 97.5%
δ' (EQU) 0.681 0.359 -0.015 0.095 0.679 1.275 1.388
p(0.3 < δ') 0.86
δ' (DEF) 0.610 0.356 -0.085 0.030 0.608 1.197 1.315
p(0.3 < δ') 0.80
表8-3を参照
差得点の効果量は$ 0.681である(EAP推定)
事後標準偏差は$ 0.359 であり、95%確信区間は$ [-0.015, 1.388] である
95%の確信で、少なくとも$ 0.095であり、高々$ 1.275しかない(RQ.8)
8.2.2. 基準値より大きい差得点の効果量
基準点$ cを定め「研究仮説$ U_{\delta' > c}: 効果量$ \delta'は$ cより大きい」が正しい確率は、以下の生成量のEAPで評価する(RQ.9)
$ u_{\delta'>c}^{(t)} = \begin{cases} 1 & \delta'^{(t)} > c \\ 0 & それ以外の場合 \end{cases} \qquad (8.11)
基準値を$ c = 0.3としたとき、差得点の効果量が$ 0.3より大きい確率$ p(\delta > 0.3)は$ 0.86である(RQ.9)
8.3. 差得点の優越率
RQ.10 差得点の優越率、$ \pi'_dの点推定・区間推定
e.g. 目測地が実測値より大きくなる確率はどれほどだろうか。またその確率を差得点の優越率と呼ぶとき、それはどの区間にあるだろう。少なくとも、あるいは高々どのくらいだろう。
RQ.11 差得点の優越率$ \pi'_dが基準確率$ cより大きい確率
e.g. 差得点の優越率が$ 0.7より大きい確率はどれほどだろう
対応がある場合の差得点の優越率
EQUでは
$ \begin{aligned} \pi'_d & = p(x_{1i}^* - x_{2i}^* > 0 \\ & = p\left(\frac{(x_{1i}^* - x_{2i}^*) - (\mu_1 - \mu_2)}{\sigma'} > \frac{0 - (\mu_1 - \mu_2)}{\sigma'}\right) \\ & = p\left(z > \frac{-(\mu_1-\mu_2)}{\sigma'}\right) \\ & = p\left(z < \frac{(\mu_1-\mu_2)}{\sigma'}\right) = p\left(z < \frac{(\mu_1-\mu_2)}{\sigma\sqrt{2(1-\rho)}}\right) \qquad (8.12) \end{aligned}
DEFでは
$ \begin{aligned} \pi'_d & = p(x_{1i}^* - x_{2i}^* > 0) = p\left(z < \frac{\mu_1-\mu_2}{\sigma'}\right) \\ & \small{[ここまでの式の変形は8.12式と同じであり、\sigma'に差得点の標準偏差を代入し]} \\ & = p\left(z < \frac{\mu_1-\mu_2}{\sqrt{\sigma_1^2+\sigma_2^2-2\rho\sigma_1\sigma_2}}\right) \qquad (8.13) \end{aligned}
8.3.1. 事後分布
差得点の優越率の事後分布はEQUとDEFでそれぞれ以下の生成量によって近似できる
$ \pi_d^{(t)} = F\left(\frac{\mu_1^{(t)}-\mu_2^{(t)}}{\sigma^{(t)}\sqrt{2(1-\rho^{(t)}}}|0, 1\right) \qquad (8.14)
$ \pi_d^{(t)} = F\left(\frac{\mu_1^{(t)}-\mu_2^{(t)}}{\sqrt{\sigma_1^{(t)2} + \sigma_2^{(t)2} - 2\rho^{(t)}\sigma_1^{(t)}\sigma_2^{(t)}}}|0, 1\right) \qquad (8.15)
近似された事後分布を要約して、点推定値、post.sd、%点、確信区間、片側上限、片側下限の点を評価する(RQ.10)
table: 表8-4 差得点の優越率の推測
EAP post.sd 2.5% 5% 50% 95% 97.5%
π'_d (EQU) 0.739 0.111 0.494 0.538 0.752 0.899 0.917
p(0.7 < π'_d) 0..67
π'_d(DEF) 0.717 0.114 0.466 0.512 0.728 0.884 0.906
p(0.7 < π'_d) 0.59
表8-4を参照
差得点の優越率は$ 0.739である
事後標準偏差は$ 0.111 であり、95%確信区間は$ [0.494, 0.917] である
95%の確信で少なくとも$ 0.538 あり、高々$ 0.899しかない(RQ.10)
https://gyazo.com/8a131d6903cbdfb03473d5d551257453
8.3.2. 基準確率より大きい差得点の優越率
優越率$ \pi'_dが基準点より大きい(小さい)確率を求めることができる
「研究仮説$ U_{\pi'_d >c}: $ \pi'_dは$ cより大きい」が正しい確率は、以下の生成量のEAPで評価する(RQ.11)
$ u_{\pi'_d>c}^{(t)} = \begin{cases} 1 & \pi'^{(t)}_d > c \\ 0 & それ以外 \end{cases} \qquad (8.16)
基準値を$ c = 0.7としたとき、差得点の優越率が$ 0.7より大きい確率$ p(0.7 < \pi'_d)は$ 0.67である(RQ.11)
8.4. 差得点の閾上率
RQ.12 差得点の閾上率$ \pi'_cの点推定・区間推定
e.g. 目測値が実測値より$ 10mm以上大きくなる確率はどれほどだろうか。またその確率を基準点$ 10mmに対する差得点の閾上率と呼ぶとき、それはどの区間にあるだろう。少なくとも、あるいは高々どのくらいだろう
RQ.13 差得点の閾上率$ \pi'_cが基準確率$ c'より大きい確率
e.g. 差得点が$ 10mm以上になる確率が$ 0.7より大きいメタ確率はどれほどだろう
基準点$ cに対する差得点の閾上率
EQUでは
$ \pi'_c = p(x_{1i}^* - x_{2i}^* > c) = p\left(z < \frac{\mu_1-\mu_2-c}{\sigma\sqrt{2(1-\rho)}}\right) \qquad (8.17)
DEFでは
$ \pi'_c = p(x_{1i}^* - x_{2i}^* >c) = p\left(z < \frac{\mu_1-\mu_2-c}{\sqrt{\sigma_1^2+\sigma_2^2-2\rho\sigma_1\sigma_2}}\right) \qquad (8.18)
8.4.1. 事後分布
閾上率$ \pi'_cの事後分布は、EQUとDEFで、それぞれ以下の生成量によって近似できる
$ \pi'^{(t)}_c = F\left(\frac{\mu_1^{(t)}-\mu_2^{(t)}-c}{\sigma^{(t)}\sqrt{2(1-\rho^{(t)})}}\middle|0, 1\right) \qquad (8.19)
$ \pi'^{(t)}_c = F\left(z < \frac{\mu_1^{(t)}-\mu_2^{(t)}-c}{\sqrt{\sigma_1^{(t)2}+\sigma_2^{(t)2}-2\rho^{(t)}\sigma_1^{(t)}\sigma_2^{(t)}}}\middle|0, 1\right) \qquad (8.20)
近似された事後分布を要約して、点推定値、post.sd、%点、確信区間、片側上限、片側下限の点を評価する(RQ.12)
table: 表8-5 差得点の閾上率の推測
EAP post.sd 2.5% 5% 50% 95% 97.5%
π'₁₀ 0.666 0.116 0.420 0.461 0.674 0.843 0.867
p(0.7 < π'₁₀) 0.41
π'₁₀ 0.650 0.118 0.402 0.444 0.657 0.830 0.856
p(-.7 < π'₁₀) 0.36
表8-5を参照
差得点の閾上率は$ 0.666(EAP推定値)
事後標準偏差は$ 0.116 であり、95%確信区間は$ [0.420, 0.867] である
95%の確信で、少なくとも$ 0.461あり、高々$ 0.843しかない(RQ.12)
https://gyazo.com/f65470d9033b33cb551b689d0cf74f05
8.4.2. 基準確率より大きい差得点の閾上率
基準点$ cより大きい測定値の差が観察される確率が、別の基準率$ c'より大きいメタ確率を求めることができる
「研究仮説$ U_{p(x_{1i}^*-x_{2i}^*>c)>c'}: 差得点の閾上率$ \pi'_cは基準確率$ c'より大きい」が正しい確率$ p(p(x_{1i}^*-x_{2i}^* >c)>c')は以下の生成量のEAPで評価できる(RQ.13)
$ u_{p(x_{1i}^*-x_{2i}^*>c)>c'}^{(t)} = \begin{cases} 1 & \pi'^{(t)}_c > c' \\ 0 & それ以外 \end{cases} \qquad (8.21)
基準値を$ c' = 0.7としたとき、差得点の閾上率が$ 0.7より大きい確率$ p(0.7<\pi'_{10})は0.41である(RQ.13)
放送授業
$ nが大きくなるとp値は平均的にいくらでも$ 0に近づく ビッグデータに対しては有意性検定は無力であり、「高度に有意」という無情報な判定を繰り返す $ nが大きくなることは分析可能な情報が増えることを意味し、望ましい状態である
「母平均の差は$ cより大きい」という研究仮説が正しい確率は、$ nの増加にともなって$ 0か$ 1に近づいていく